查看原文
其他

隐私计算专家问答,涉及数据跨境、ChatGPT、医疗与政府数据的互联互通

脱离数据安全谈数字经济的发展是虚妄的,且不能高效流通数据的数字经济是僵死的。安全与流通,两者的平衡,仅仅通过制度规定还不足以实现。技术发展带来的问题,还是要靠技术来解决。在此背景下,隐私计算被寄予厚望。所谓隐私计算,是指在保护数据本身不对外泄的前提下实现数据分析计算的技术集合,达到数据“可用不可见”的目的,在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。

中国精算师协会会长、数字保险智库学术委员会主席王和,全联并购公会信用委副主任、北京信用学会副会长刘新海,洞见科技创始人、董事长姚明,锘崴科技合伙人、医疗大健康事业部总经理吴凡,零壹智库CEO柏亮围绕《隐私计算:数字经济新基建》共同探讨了隐私计算在数字经济时代的发展、应用、创新和趋势。本文对交流进行记录。
使用不同的隐私计算平台,对数据信息互联互通有影响吗?
姚明:肯定有影响。在没开源的前提之下,隐私计算公司对于数据的处理机制、计算的协议其实都是黑盒状态,这也正是互联互通技术标准建立的初衷。从约束性角度来说,未来,相关标准应该会约束其他隐私计算厂商,对于新进入隐私计算赛道的一些创业公司,在做自己的平台算法和架构时,也一定会参考互联互通的技术标准。

从商业化落地角度来看,确实有一些客户构建了自己的互联互通平台,它可能是一个数据应用方,和它所提供数据的机构使用不同的隐私计算平台。这时,需要建立互联互通的底座,包括去做互联互通实质性的交互开发,这已成为现在商业化的常态。
从影响的方面来说,第一、技术的复杂度肯定会增加。标准虽然建立了,但是需要适配这个标准,然后对于自身的技术体系做出一些规范和调整是必不可少的。第二、这种互联互通的技术体系本身不同于开源。如果开源的话,大家很容易就互联互通了,目前我们所有谈到的互联互通是指至少有一方是闭源状态。对于闭源的互联互通,势必会涉及到算法的可信和互通协议的安全问题。从技术上来说,我们需要不断地去优化和迭代这套标准体系,让连接的多方能更容易建立信任,更容易评估平台互联互通之后的安全性。
医疗领域数据信息互联互通存在哪些困难?
吴凡举个简单例子,目前很多医院应用的医院信息系统HIS,以及电子病历和患者主索引软件EMR,这两种软件都存储了患者信息、医生的诊疗诊断信息等。在美国做这类软件的厂商只有三四家,这意味着只要这三四家的接口打通就可以互联了,但在中国这类厂商有三四百家,要把所有接口都打通非常困难。
不过,经过十多年的发展,目前医疗领域数据互联互通已经有了很好的进展。原因在于我国要求电子病历标准化,医院和区域互联互通已经做了很多年。目前的状况是,相比十年前明显看到了很多进展,但是仍然没有办法做到畅通无阻的互联互通。所以一方面需要用新的技术去打通,另一方面需要在法律法规层面来解决。
信创产品用了飞腾的CPU、麒麟的操作系统、达摩的数据库,这是否是一个可信的环境?国外像英特尔、AMD、ARM等都有自己的TEE(可信执行环境),这两者有何区别?

吴凡这两种一个可以理解为广义的可信执行环境,另一种则是狭义的可信执行环境。
广义的可信执行环境就是大的信创范畴,包含数据库、服务器、各种各样的服务器操作系统等等来达到可信。狭义的可信执行环境,比如英特尔的SGX,是真正的可信执行环境。TEE是一种单独的技术,是在计算平台上以软硬件方法构建的一个安全区域,保证在安全区域内加载的代码和数据在机密性和完整性方面得到保护
广义、狭义这两者不冲突,未来在整个大的信创范畴内,也会应用到隐私保护计算的可信执行环境。
政府数据开放有何效果?在数据要素市场产生经济价值了吗?
姚明政府数据开放和商业化数据开放有着本质的差异。对于政府数据开放来说,商业变现不是主要诉求,更多还是促进社会公益和赋能实体经济发展。同时,政府数据开放,是在分类分级标准指引下的逐步开放。从2021年开始,已有一些政府数据基于隐私计算开放的商业案例真正落地。不过,各地方政府数据底层基础设施的完备程度不同,分类分级标准也并不完全统一,所以也会导致各地政府数据目录有比较大的差异。

目前,对于这类纯粹的公共数据开放,障碍是最小的。比如说一些环保的信息、治理的信息、统计类信息或者群体类信息开放,几乎没有什么障碍。阻力比较大的是涉及主体信息的数据开放,不管是以个人为主体还是以企业为主体,这类数据往往价值更大、更直观,从风险角度来说也是挑战最大的。所以也导致了各地方政府对于这类数据开放的程度、颗粒化细化程度和开放时间的步调会形成比较大的差异。

随着隐私计算技术的推广和被信任,“数据二十条”等政策的发布,越来越多的行业标准和测评认证机构给予隐私计算技术以肯定,隐私计算势必会逐步改善这件事情,但是从进展来说政府数据开放的进度仍远远落后于商业化数据开放的进度。
断直连模式在隐私计算普及的情况下能取消吗?
刘新海断直连的初衷是想解决个人隐私保护以及网络信息安全问题。如果有技术手段把这两个问题解决了,监管放心,社会放心,银行也放心。所以大家尝试隐私计算,但其基础设施建设不是一时半会可以完成的。目前征信机构还有很大问题,作为新生机构,它们的服务能力跟不上,同时也伴随着监管问题,建议隐私计算厂商可以往征信方向尝试。

隐私计算还有两大问题也不能忽视,第一个是效率,隐私计算数据处理效率问题亟待解决。另外一个问题是隐私计算需要配套机制。此外还包括大众对隐私计算的认知,新技术要想完全推广应用不是特别容易的事情,特别是这类非常前沿、有挑战性的技术。
在数据跨境上,隐私计算有哪些应用或尝试?
姚明基于隐私计算技术的数据跨境,洞见科技在2020年就已开始尝试。从技术上来说已经具备了商业化条件,但依然会受政策性因素的困扰。

目前很多企业实行报备机制,比如报备哪些数据要离境,数据要用于什么目的等等。从监管的视角来看,企业是不是如自己所宣称、报备的那样,输出数据和报回数据内容是一致的,这实际上是一个监管问题。应用隐私计算技术,并给出一些方案和探索实践,主要是从监管这个角度来说。在数据可用不可见的情况之下,去验证这些企业所宣称的与实际的行动结果是否一致,是否符合国家政策法规的要求,仍需要隐私计算厂商继续去做探索和实践。

刘新海:通过研究全球征信,我发现其实在没有隐私计算之前,数据跨境早就实现了,比如欧美之间的通商数据早就跨境了,人都可以流动、数据自然也跟着动了。具体的例子像欧盟一体化,它的征信数据是可以跨境流动的,他们当时是在机制的设计下就搞成了,那是十年前的事,当时还没有隐私计算。

现在有了隐私计算技术,我觉得会更好。目前粤港澳大湾区数据、征信为什么推不动,最重要的问题是没有一个非常强有力的“领导”,当然监管也需要有人来推动。另外隐私计算技术在国内要想大量应用,需要一步一步地推广,一步一步地解决跨境问题、征信问题、AI问题以及数据孤岛的问题。
通用隐私计算技术的出现,突破了隐私计算?
姚明这是个技术问题。没有万能的技术只有万能的方案,方案是对技术的拼接和对技术本身的重组和重构。

隐私计算技术所谓的流派之争,并不是在商业化实践层面,更多是在学术层面有争议。商业化实践的层面更多围绕行业的一个领域、客户的具体需求给出最优解决方案,这个方案包括技术本身,也包括它的商业性价比,这其实才是真正推动一项技术快速迭代和产生大规模应用的出发点。

我们当然希望有理想化的技术可以解决全部的问题,理论上来说,密码学、同态加密等这些技术的组合可以解决绝大部分技术场景的问题,但是因为计算复杂度、性能、网络带宽消耗等问题,导致在商业化的过程中遇到了各式各样的问题,无法真正取得大量商业案例的落地,这才有了大家去研发新的、更轻量化的技术体系。

从我的角度来看,通用型技术就是一套融合引擎。刚才谈到ChatGPT,它并不是一个技术而是一类技术,仅仅靠着一类技术仍然不能够去开发出超级人工智能模型,还需要喂进去大量的数据,这正好补充了一点,对数据跨境,摆在面前最实际的问题就是ChatGPT需要数据喂它的时候,如果你用的是境外的ChatGPT,可能数据就已经出境了。

前几天有很多国家,包括国内的一些机构,在讨论要不要断掉ChatGPT现阶段的使用或者限制,说明一项技术即使通用也可能产生很多意想不到的负面东西,所以需要综合更多的技术,或者更多的方案才能变成让各方都满意的解决方案。在我看来,ChatGPT在不远的将来也会引入隐私计算等技术,堵上当前数据泄露或者隐私泄露的“坑”

吴凡通用取决于从哪个角度去看,对于厂商和供应方来讲,我认为是不可能通用的。目前隐私计算的技术框架有3种,即依赖硬件的可信执行环境,依赖密码学的MPC及同态加密,依赖人工智能的联邦学习,这些技术路径不可能通用。

但是从用户的角度讲,最终肯定是通用的,因为用户最终只看到一个结果——是不是计算效率够高、是不是算力很少、是不是能达到精确的计算结果。这是整个行业努力的一个方向,即用各种各样不通用的技术方式,最终达到给用户通用的结果和感受。

“数据二十条”对隐私计算的落地有哪些助推作用?
刘新海国家数据局的组建,意在促进数据的应用,以及促进数据的集中管理。未来的职能仍有待观察,对隐私计算肯定有促进作用,但是不能期望太高。在研究数据的过程中,我发现有些理念跟现代实际的体量以及应用的生态是不匹配的。大家不能只依靠国家来出政策,而是需要行业、智库以及各方力量共同推进。相关链接:构建数据基础制度体系 “数据二十条”来了!






隐私计算未来要想快速发展,最重要的三件事是什么?
吴凡第一个最想干的事是把《隐私计算:数字经济新基建》这本书读完。第二,希望更多拥有数据的人可以了解隐私计算这项技术,并且信任这项技术。第三,希望行业对技术供应方案的要求更严苛些,倒逼业内真正有技术实力的公司和人才脱颖而出,如果说行业需求始终局限在level100,那就没有办法真正检验出拥有level500技术能力的公司,希望这个时刻尽快的到来。

姚明集中精力做好一件事,那就是不断地去打磨从底层技术研发到服务客户的完整体系,给客户简单、易用、好用的产品服务体系。

刘新海ChatGPT的巨大成功逼出来一个大招,类似的模式是不是能用到隐私计算中,比如产学研的整合。拿征信来说,央行征信中心每年有大量的经费,这些是否可以投入到大规模的应用上,用最顶尖的人才,年轻人挂帅,把这种研发的机制学过来,对隐私计算将来的突破,以及真正实现新型基础设施建设,是非常重要的。

来源:零壹财经,作者:楚济慈,版权归属原作者,分享仅供学习参考,如有不当,请联系我们处理。



END
往期推荐01案例分享 | 光大证券数据安全治理体系建设与实践02AI遭“围剿”!欧洲、中国之后,美国出手对ChatGPT 进行监管!03《数据安全产品与服务观察报告》发布,数据防泄漏领域迎来新机会!

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存